繼2016年在台北COMPUTEX發表最新款CPU、GPU授權方案後,時隔一年,安謀國際(ARM)又選在COMPUTEX展會期間發表最新一代CPU及GPU方案。值得注意的是,受到人工智慧(AI)影響,今年ARM的新CPU及GPU不僅對AI算法有更完善的支援,同時在平台發展策略上也做了明顯調整。
ARM副總裁暨運算產品事業部總經理Nandan Nayampally表示,集中式(Centralized)的人工智慧架構在安全及隱私方面有許多疑慮,而且對網路基礎建設有相當高的依存度。ARM對人工智慧的願景是實現安全且無所不在的人工智慧。為了實現這個目標,ARM有責任重新規劃其產品,以便為網路端點與雲端挹注更具效率且安全的分散式智慧(Distributed Intelligence)。
ARM在2017年3月發表其DynamIQ技術,並於COMPUTEX期間發表首波支援該技術的Cortex-A75、Cortex-A55處理器。這兩款處理器均支援專為提升人工智慧運算效能設計的專屬指令集,以便在未來3~5年將人工智慧運算效能提升50倍。另一方面,這些支援DynamIQ的核心,可以用更具彈性的方式組成核心叢集,以便在性能、功耗及成本上滿足更多元的應用需求。
更細分來看,Cortex-A75是一款效能接近筆記型電腦處理器的高效能核心,其單執行緒的處理效能比前一代核心大幅提升50%,還搭載更好的多核處理功能,筆記型電腦、網路設備或伺服器,都是這款核心鎖定的應用目標。Cortex-A55則鎖定在中階市場,雖然效能不比A75,但比起前一代相同定位的Cortex-A53,其每毫瓦效能仍提高了2.5倍。
至於在GPU方面,ARM則發表最新款GPU授權核心Mali-G72。相較於前一代G71核心,G72核心支援Mobile Multiview、MultisamplingAnti-Aliasing、ASTC、Foveated Rendering與PLS-G Buffer等新技術,可以在更節省頻寬的前提下提供更好的虛擬實境視覺體驗。據估計,在執行同一款遊戲的情況下,G72核心的GPU寫入頻寬將比G71節省68%,因此省電性能將大幅提升。
事實上,不管是虛擬實境運算或是人工智慧運算,最耗電的任務都不是運算本身,而是大量的資料傳輸。因此,任何能節省頻寬的新技術,都可以對晶片耗電量帶來明顯改善。
除了新的CPU及GPU核心外,ARM也發表了全新的ARM Compute Library。這款免費開源的函式庫(Library)彙集了一系列針對Cortex CPU及Mali GPU架構最佳化的低階軟體函數,不管是現有或即將推出的ARM SoC,都可以從這個函式庫獲得明顯的人工智慧演算法效能提升效益。據ARM內部估計,採用這個函式庫,機器學習與人工智慧演算法的效能將可提升10~15倍之多。
此外,這個函式庫也是ARM針對人工智慧所做的最大策略調整之一。該函式庫不只支援ARM自家的處理器核心,同時也可以支援其他第三方人工智慧加速器矽智財(IP)。
Nayampally指出,人工智慧演算法加速器並不在ARM的產品發展藍圖裡,但許多晶片開發者都會在設計SoC時添加某種加速器,以提升執行某些人工智慧演算法的效率。ARM副總裁暨多媒體處理器事業部總經理Jem Davies則補充,由於客戶採用的演算法不同,因此這類加速器可能是可編程的數位訊號處理器(DSP),也可能是固定功能的實體電路,端視客戶的應用需求而定。因此,ARM將透過提供函式庫的方式來協助客戶實現SoC整合,並提高各種異質核心的協作效率。
除了新核心與新的函式庫外,ARM也推出了對應的軟體開發環境。結合虛擬原型(Virtual Prototype)與DS-5 Development Studio開發環境,軟體開發者將可在ARM生態系統推出晶片硬體前,便開始著手開發針對DynamIQ最佳化的軟體。
Nayampally總結,展望未來5年,基於ARM核心的處理器晶片出貨量,將達到1,000億顆。為了實現這個目標,ARM的生態系統必須從實體運算世界轉型到無所不在的運算(Total Compute)。在本屆COMPUTEX期間所發表的新產品,將使ARM與其合作夥伴更接近Total Compute的願景,並帶動智慧解決方案的轉型。